StudyTree_01_대규모 기능 개선
이전 글 보기: 블로그_10_Study Tree 기능 추가
대규모 업데이트
Study Tree 기능을 처음 만든 이후로 한 달 정도 지났다.
그동안 사용하면서 문제점들이 보였고, 이번에 대규모 개선 작업을 진행했다.
문제점
기존 AI 파이프라인에서 몇 가지 심각한 문제가 있었다.
AI 추천 불균형
AI가 추천 노드를 생성할 때 특정 카테고리(정보 보안)에 과도하게 집중됐다.
295개 AI 추천 중 240개가 "정보 보안" 카테고리로 쏠리는 현상이 발생했다.
학습 브리핑 패널이 제대로 작동하지 않는 원인이었다.
그룹당 중복 추천
AI가 프롬프트를 무시하고 그룹당 여러 개의 추천을 생성하는 문제가 있었다.
배치 처리 시 중복 제거 로직이 배치 내에서만 작동해서, 전체적으로는 중복이 발생했다.
개선 내용
1. AI 모델 최적화
비용 절감을 위해 단순 작업에는 GPT-5 Nano를 사용하도록 변경했다.
- Step 2 (유사 이름 찾기): Mini → Nano로 변경
- 신규 (AI 유사도 판단): Nano로 추가
2. 카테고리 강제 적용
AI가 반환한 카테고리를 무조건 신뢰하지 않고, groups.json에서 해당 그룹의 실제 카테고리를 조회해서 강제 적용하도록 수정했다.
이제 AI가 잘못된 카테고리를 반환해도 자동으로 보정된다.
3. 그룹당 1개 제한
배치 내 중복 제거가 아닌, 전체 결과에서 그룹당 1개만 유지하도록 로직을 변경했다.
155개 그룹 중 64개 그룹에 대해 각각 1개씩 추천이 생성됐다.
나머지 91개 그룹은 AI가 "추천할 게 없다"고 판단한 것으로, 이미 충분히 완성된 그룹으로 보인다.
4. AI 유사도 판단
새 콘텐츠가 추가될 때 기존 AI 추천과 의미적으로 유사한지 판단하는 기능을 추가했다.
영문과 한글이 달라도 의미가 같으면 통합되도록 했다.
예를 들어 "웹사이트 구축(Web Development)"과 "웹 개발(Web Development)"은 유사하다고 판단한다.
5. MACRO Gap Analysis 개선
새 그룹 추천 시 카테고리별 1개씩만 생성하도록 수정했다.
12개 카테고리에 12개 새 그룹이 깔끔하게 생성된다.
이번 작업으로 AI 파이프라인이 훨씬 안정적이고 예측 가능해졌다.
학습 브리핑 패널도 이제 제대로 작동할 것이다.
다음에는 UI/UX 개선이나 성능 최적화 작업을 진행할 예정이다.